Homoskedasticity and Heteroskedasticity
若样本是独立同分布的,则有
定义样本误差项的条件方差矩阵为
一般地,条件方差矩阵为
其中,
Homogeneity 假设为 主对角线元素相同,即
Heterogeneity 假设为 主对角线元素不同,即
Uncorrelated 假设为 非主对角线元素为 0,即
根据定义,只需要样本是独立同分布的就满足 Uncorrelated 假设
Correlated 假设为 非主对角线元素不为 0,即
- 对于时间序列数据,若 ,称为(一阶)Autocorrelated
- 对于截面数据,若 ,称组 存在 Clustercorrelated
同方差(Homoskedasticity)指 Homogeneity 和 Uncorrelated,即
异方差(Heteroskedasticity)指 Heterogeneity 和 Uncorrelated,即
Estimate Conditional Variance of Error
在同方差假设下,估计 相当于要估计 ,一个朴素(naive)估计量是残差的平方均值:
然而,这个估计量是有偏的。
变换表达式为:
这是因为① Annihilator Matrix 的性质 ② 是一个二次型,也就是一个数(1×1 矩阵),根据 Trace Operator 的定义,数的迹等于自己。
朴素估计量的条件期望为
其中, 表示线性投影后剩余的维度,见 Annihilator Matrix
因此,需要经过一些调整得到无偏估计量
从而得到同方差假设下的参数估计量条件方差估计值为
相应的,第 个自变量的标准差为
Robust Standard Variance of LS Estimator
在异方差假设下,估计 相当于要估计 ,一个朴素(naive)估计量是残差的平方:
从而得到异方差假设下的参数估计量条件方差估计量为
然而朴素估计量是有偏的,无偏估计量为
从而得到异方差假设下的参数估计量条件方差估计量为
相应的,第 个自变量所谓稳健标准差为
其中, 表示 主对角线上第 个元素。
这也是 stata 当中使用 robust
选项默认使用的估计量
Cluster Robust